细分领域下的专利挖掘、申请与布局分析
文章来源:三友知识产权
大数据有何建树?
乔布斯为了对自身所有DNA和肿瘤DNA进行排序而支付了高达几十万美元的费用。医生按照所有基因按需下药,帮助乔布斯延长了好几年的寿命。
2013年,微软纽约研究院的经济学家大卫•罗斯柴尔德(David Rothschild)利用大数据成功预测24个奥斯卡奖项中的19个,第86届奥斯卡金像奖颁奖典礼中24个奖项中预测出21个,可见大数据的魔力。
大数据专利申请态势
大数据主要包括大数据应用层、大数据平台处理层以及数据源三层,很多专利申请均是两种或两种以上技术的结合。
从地域上看,90%以上的专利分布在中国和美国,欧洲、日韩公开量比较小,约为6%。
数据可视化、商业智能、数据挖掘、安全等技术申请人概览 ↓↓↓
大数据专利申请布局
(一)大数据应用
1、数据挖掘
数据挖掘技术在市场、工业生产、金融、医学、科学研究、工程诊断等领域广泛应用。
这个领域的专利申请量在大数据应用层中居首位,增长趋势也很明显。从2010年到2018年上半年,已经申请2000多件专利。
数据挖掘技术主要申请人有IBM、谷歌、亚马逊、惠普、国家电网及百度。
就目前专利申请发展来看,数据挖掘的热点主要包括:数据流挖掘、文本挖掘、Web挖掘、及生物信息数据挖掘四个方面。
从专利申请发展趋势来看,未来数据挖掘技术相关专利申请趋势主要涉及:
(1) 数据挖掘技术与特定商业逻辑的平滑集成问题;
(2) 数据挖掘技术与特定数据存储类型的适应问题;
(3) 大型数据的选择与预处理问题;
(4) 数据挖掘系统的构架与交互式挖掘技术;
(5) 数据挖掘语言与系统的可视化问题;
(6) 数据挖掘理论与算法研究;
(7) 与数据库数据仓库系统集成;
(8) 与语言模型系统集成;
(9) 挖掘各种复杂类型的数据;
(10) 支持移动环境。
2、可视化
这个领域的专利申请量比较高,增长趋势也很明显。从2010年到2017,已经申请了880多件专利。我们看到主要的申请人包括IT企业、互联网企业,包括有一些初创公司。国外这块,除了IBM、微软之外,还可以关注一些公司,像Splunk、Platfora这些公司他们申请量是很高的。国内这块,除了传统的IT企业、互联网企业、研究机构、高校以外,产品市场上做的比较好的,比如一些初创企业——永洪科技等,大家能够关注这一方面的知识产权保护。
可视化技术中,像交互性以及多维数据分析可能还是国外企业的优势更明显一些。但是,可视化这个技术在各个行业里面有很好的应用,例如可视化和交通、电力、地图、社交这些传统的行业或者是互联网的一些业务融合,在这一方面申请了很多的专利。
3、智能BI
2010-2017年共申请专利800余件
大数据的到来,扩展了BI的外延,吸引了更多企业的关注,2010-2017年共申请专利800余件,中美是主导,BI产品的方案解决商是专利的主要掌控方。
美国主要有:SAP、微软、IBM优势明显,另外,splunk和标签管理供应商Tealium进行了较好的专利布局,大家可以关注下)。
中国:浪潮、用友等IT企业位于前列,同时京东、阿里、国家电网也存在BI专利布局,部分创业小公司如上海云数也有少量专利申请,可以关注下。
趋势:BI终端用户视觉体验受到关注,向云端迁移是BI的趋势。
4、安全和隐私保护
安全和隐私保护在2010-2017专利申请达到700多件,中美占据了80%以上。
安全和隐私保护在2010-2017专利申请达到700多件,其中,中美还是占据了大头,80%以上。其中,微软和IBM在安全认证加密领域有深厚的基础;中国企业主要是华为、360、浪潮,科研单位主要有中科院、国家电网等。
差分隐私/同态加密/访问控制/大数据审计是专利布局的热点,其中:
差分隐私主要申请人包括:IBM、谷歌
同态加密(加密存储)THOMSON许可公司、微软、IBM
注意专利海盗、专利蟑螂,如Thomson Licensing及微软下的一个关于Licensing子公司,大家可以关注下。
安全和隐私保护专利申请的差异明显:高校侧重算法设计,企业专利注重整体保护。
(二)大数据平台
1、非关系型数据库
从2010年至2017年,专利申请量达到了将近2000件专利申请。数量上,从中国明显占优。但是国内(授权率11%)与美国(授权率41%)相比授权率特别低,质量上有待提高。
非关系型数据库中文档数据库,将近90%的专利都是在华申请,像美国、欧洲、日韩一共才约占到全球的10%。中国主要申请人包括奇虎、长虹等。
关系型数据库和非关系型数据库成为主导。这个融合主要体现在两个途径上,第一个途径实际上就是关系型数据库和非关系型数据库的互相支持,取长补短。另外一个融合的方法就是对于这种数据结构非常复杂,数据量非常大的情况下,可能大家更趋向于采用这种联合部署的一些方案。
2、内存计算
2010至2017全球大概共申请708件。
2010至2017全球大概共申请708件,内存计算今年呈现爆发式增长,未来热度将会持续数年。国外巨头在华申请的布局建议大家多关注。国外主要申请人:IBM、Oracle等。中国:华为、中兴为龙头。
3、MPP(并行数据库)
2010至2017全球大概共申请300余件,传统的MPP申请量很小,在专利布局时需要注意。近两年,MPP主要有两条技术路线:1、MPP与开源式分布式系统的融合,主要可以参考IBM、EMC、HP、Google;2、Shared everything。
国内与国外相比差距巨大,国内技术主要在存储、横向扩展及Shared nothing。
4、分布式计算
分布式计算属于较为成熟的技术,全球有500多件专利,中国相比美国稍占优势。
可以重点关注任务调度相关技术,美国这块占绝对主导地位,IBM及HP等企业在任务调度这块有一定专利布局(还有一个就是专利海盗ThomsonLICENSING)。国内这一块主要是高校、研究机构。
(三)数据源-数据资源管理(ETLExtract-Transform-Load)
ETL在2010-2017之间共申请800余件。
ETL在2010-2017之间共申请800余件,申请人主要集中在IT和互联网。主要有:IBM、Oracle、HP、浪潮、百度、阿里、久其软件等,其中有一部分是我们的客户。
主要热点:
ETL工具:IBM、浪潮、百度、阿里
软件维护测试:IBM、阿里、Oracle
任务管理:IBM、阿里、微软
异常处理:国家电网、IBM
大数据专利申请保护问题
1、客体问题
纯算法保护问题:尤其需要注意的领域:流计算、分布式计算、内存计算等。
商业模式保护问题:主要的技术领域:智能BI、资源管理
2、主要保护主体
产品的解决方案商(如BI产品)、供应商(如Tealium)、平台服务商、应用服务商
编辑:北京三友
推荐阅读:高价值专利培育研修班(上海7月20-22)
推荐阅读:科技成果转移转化实际运用研修班(青岛7月27-29)